本文提出了在基于技术指标的股票交易的背景下的非主导分类遗传算法-II(NSGA-II),通过寻找销售买卖策略,使目标,即锐利比例和销售策略的最佳组合最大缩放分别最大化并最小化。选择NSGA-II,因为它是一种非常流行和强大的双目标进化算法。培训和测试使用了一种基于滚动的方法(两年培训和测试的一年),因此在没有主要经济波动的情况下,这种方法的结果在稳定的时期中似乎更好。此外,本研究的另一个重要贡献是通过整个建模方法纳入交易成本和领域专业知识。
translated by 谷歌翻译
Of late, insurance fraud detection has assumed immense significance owing to the huge financial & reputational losses fraud entails and the phenomenal success of the fraud detection techniques. Insurance is majorly divided into two categories: (i) Life and (ii) Non-life. Non-life insurance in turn includes health insurance and auto insurance among other things. In either of the categories, the fraud detection techniques should be designed in such a way that they capture as many fraudulent transactions as possible. Owing to the rarity of fraudulent transactions, in this paper, we propose a chaotic variational autoencoder (C-VAE to perform one-class classification (OCC) on genuine transactions. Here, we employed the logistic chaotic map to generate random noise in the latent space. The effectiveness of C-VAE is demonstrated on the health insurance fraud and auto insurance datasets. We considered vanilla Variational Auto Encoder (VAE) as the baseline. It is observed that C-VAE outperformed VAE in both datasets. C-VAE achieved a classification rate of 77.9% and 87.25% in health and automobile insurance datasets respectively. Further, the t-test conducted at 1% level of significance and 18 degrees of freedom infers that C-VAE is statistically significant than the VAE.
translated by 谷歌翻译
Efficient energy consumption is crucial for achieving sustainable energy goals in the era of climate change and grid modernization. Thus, it is vital to understand how energy is consumed at finer resolutions such as household in order to plan demand-response events or analyze the impacts of weather, electricity prices, electric vehicles, solar, and occupancy schedules on energy consumption. However, availability and access to detailed energy-use data, which would enable detailed studies, has been rare. In this paper, we release a unique, large-scale, synthetic, residential energy-use dataset for the residential sector across the contiguous United States covering millions of households. The data comprise of hourly energy use profiles for synthetic households, disaggregated into Thermostatically Controlled Loads (TCL) and appliance use. The underlying framework is constructed using a bottom-up approach. Diverse open-source surveys and first principles models are used for end-use modeling. Extensive validation of the synthetic dataset has been conducted through comparisons with reported energy-use data. We present a detailed, open, high-resolution, residential energy-use dataset for the United States.
translated by 谷歌翻译
小波神经网络(WNN)已在许多领域应用于解决回归和分类问题。大数据出现后,随着数据以轻快的速度生成,必须一旦生成,因为数据的性质可能会在短时间间隔发生巨大变化,因此必须立即进行分析。这是必要的,这是必不可少的,那就是大数据全是普遍的,并给数据科学家带来了计算挑战。因此,在本文中,我们构建了一种有效的可扩展,并行的小波神经网络(SPWNN),该神经网络(SPWNN)采用了平行的随机梯度算法(SGD)算法。 SPWNN是在水平并行化框架中的静态和流环境下设计和开发的。 SPWNN是通过使用Morlet和高斯函数作为激活函数来实现的。这项研究是在具有超过400万个样本和医学研究数据等大数据集上进行的,该数据具有超过10,000个功能,其本质上具有很高的尺寸。实验分析表明,在静态环境中,具有Morlet激活函数的SPWNN优于分类数据集上的高斯SPWNN。但是,在回归的情况下,观察到了相反的情况。相反,在流媒体环境中,高斯在分类方面的表现优于莫雷特,而莫雷特在回归数据集上的表现优于高斯。总体而言,拟议的SPWNN体系结构的速度为1.32-1.40。
translated by 谷歌翻译
疏散计划是灾难管理的关键部分,其目标是将人员搬迁到安全和减少伤亡。每个疏散计划都有两个基本组件:路由和调度。但是,这两个组件与目标的联合优化,例如最大程度地减少平均疏散时间或疏散完成时间,这是一个计算问题上的问题。为了解决它,我们提出了MIP-LNS,这是一种可扩展的优化方法,将启发式搜索与数学优化结合在一起,并可以优化各种目标函数。我们使用来自德克萨斯州休斯敦的哈里斯县的现实世界道路网络和人口数据,并应用MIP-LNS来查找该地区的疏散路线和时间表。我们表明,在给定的时间限制内,我们提出的方法在平均疏散时间,疏散完成时间和解决方案的最佳保证方面找到了比现有方法更好的解决方案。我们在研究区域进行基于代理的疏散模拟,以证明解决方案的功效和鲁棒性。我们表明,即使撤离人员在一定程度上偏离了建议的时间表,我们的规定疏散计划仍然有效。我们还研究了疏散计划如何受到道路故障的影响。我们的结果表明,MIP-LN可以使用有关道路估计截止日期的信息,以成功,方便地撤离更多人,以提出更好的疏散计划。
translated by 谷歌翻译
最近,为了在各个领域之间具有更好的可接受性,研究人员认为,机器智能算法必须能够提供人类可以在因果关系中理解的解释。这一方面也称为可控性,可以达到特定水平的人类水平解释性。一种称为反事实的特定算法可能能够提供可有效性。在统计数据中,因果关系已被研究和应用多年,但在人工智能(AI)方面尚未详细介绍。在首次研究的研究中,我们采用了因果推理的原则来提供解释性来解决分析客户关系管理(ACRM)问题。在银行和保险的背景下,有关解释性的当前研究试图解决与因果关系有关的问题,例如为什么该模型做出这样的决定,并且该模型的选择是否受到特定因素的影响?我们提出了一种以干预形式的解决方案,其中研究了目标特征的ACRM数据集特征分布的效果。随后,还获得了一套反事实,可以向任何需要解释银行/保险公司做出的决定的客户提供。除了信用卡流失预测数据集外,还为贷款默认,保险欺诈检测和信用卡欺诈检测数据集生成了高质量的反事实,其中观察到不超过三个功能的变化。
translated by 谷歌翻译
近年来,可解释的人工智能(XAI)研究因对用户社区对AI的更高透明度和信任的需求而获得了突出性。这尤其重要,因为AI在金融,医学等敏感领域采用,在这种敏感领域,对社会,道德和安全的影响是巨大的。经过彻底的系统评估,XAI的工作主要集中于机器学习(ML)进行分类,决策或行动。据我们所知,没有任何据报道提供可解释的加固学习(XRL)方法来交易金融股票的方法。在本文中,我们提议在流行的深层增强学习体系结构,深Q网络(DQN)上采用Shapley添加说明(SHAP),以解释代理商在给定实例中在金融股票交易中的行动。为了证明我们方法的有效性,我们在两个流行的数据集(即Sensex和DJIA)上对其进行了测试,并报告了结果。
translated by 谷歌翻译
机器学习和深度学习模型需要大量的培训过程数据,在某些情况下,可能会有一些敏感数据,例如涉及的客户信息,组织可能会犹豫要外包模型构建。一些隐私保护技术,例如差异隐私,同构加密和安全的多方计算,可以与不同的机器学习和深度学习算法集成,以为数据以及模型提供安全性。在本文中,我们建议使用完全同构的加密加密进行混乱的极端学习机及其加密形式,其中使用逻辑图而不是均匀分布生成权重和偏见。我们提出的方法在大多数数据集中都可以更好地或类似于传统的极限学习机器。
translated by 谷歌翻译
机器学习中最困难的任务是解释训练有素的浅神经网络。深度神经网络(DNNS)为更多的任务提供了令人印象深刻的结果,但是通常不清楚这种训练有素的深神经网络如何做出决策。提供特征重要性是浅层神经网络中使用的最重要和流行的解释技术。在本文中,我们开发了一种算法,扩展了Garson算法的思想,以解释基于信念网络的自动编码器(DBNA)。它用于确定DBN中每个输入特征的贡献。它可用于具有许多隐藏层的任何神经网络。该方法的有效性在分类和从文献中获取的回归数据集进行了测试。将此方法鉴定出的重要特征与Wald Chi Square(\ c {hi} 2)获得的特征进行了比较。对于4个分类数据集中的2个和5个回归数据集中的2个,我们提出的方法导致识别更好质量的特征,从而导致统计上更重要的结果,相对于wald \ c {hi} 2。
translated by 谷歌翻译
数值模拟中信息丢失可能来自各种来源,同时求解离散的部分微分方程。特别地,与等效的64位模拟相比,使用低精确的16位浮点算术进行模拟时,与精度相关的错误可能会积累在关注量中。在这里,低精度计算所需的资源要比高精度计算要低得多。最近提出的几种机器学习(ML)技术已成功纠正空间离散化引起的错误。在这项工作中,我们扩展了这些技术,以改善使用低数值精度进行的计算流体动力学(CFD)模拟。我们首先量化了在Kolmogorov强制湍流测试案例中累积的精度相关误差。随后,我们采用了卷积神经网络以及执行16位算术的完全可区分的数值求解器,以学习紧密耦合的ML-CFD混合求解器。与16位求解器相比,我们证明了ML-CFD混合求解器在减少速度场中的误差积累并在较高频率下改善动能光谱的功效。
translated by 谷歌翻译